查看原文
其他

数据猿专访 | 天云大数据CEO雷涛:人工智能已进入产业化爆发阶段,再不醒醒就会错过所有机会

2016-10-28 张叶 数据猿
<数据猿导读>

随着互联网和大数据技术的高速发展,面向特定领域的人工智能技术已取得突破性进展;谷歌、微软、百度等巨头积极的在人工智能领域多点布局、抢占产业机遇;而其他以人工智能运算和应用为产品的初创公司也纷纷出现并发展。天云大数据CEO雷涛告诉数据猿记者,人工智能产业化的春天,来了


来源:数据猿 记者:张叶


根据艾瑞数据预计,2020年全球AI市场规模将达1190亿元,年复合增速约19.7%;同期,中国AI市场规模将达91亿元,年复合增速超50%。AI产业的市场空间可谓是极为广阔。举例来说,Google公司正致力于无人车项目、IBM已携手Apple联合开发健康大数据人工智能平台、Facebook正测试名为“M ”的人工智能助手服务;而国内,百度已将人工智能当做自身发展的先锋力量,乐视推出了超级大脑,猎豹投入5000万美元研发机器人...众多互联网巨头都在扩张对AI产业的人才、资金投入,加速对AI领域的产业布局。


诸多因素交织在一起,无疑在向我们传递一个信号:AI行业已经成为新风口,产业化进程成为必然趋势。


天云大数据CEO雷涛告诉数据猿记者,随着互联网和大数据技术的高速发展,面向特定领域的人工智能技术已经取得突破性进展,谷歌、微软、百度等巨头积极的在人工智能领域多点布局、抢占产业机遇,而其他以人工智能运算和应用为产品的初创公司也纷纷出现并发展。人工智能产业化的春天,来了!


数据是人工智能的引爆点


随着技术的不断发展,在不久的将来,人工智能将会成为各行业的企业“标配”。在天云大数据CEO雷涛看来,目前,人工智能已经进入产业化爆发阶段,原因有三点:


第一,海量数据出现。AI的目标是让机器像人类一样学习、工作,算法训练也好,深度学习也罢,都需要大量数据支持。以前只有信息系统在生产数据,比如Oracle、IBM支撑的IT系统,而现在互联网、物联网都在同时爆发海量数据。此外,很多有序组织的数据也正在被科研机构释放,比如谷歌开源的大规模语言建模模型One Billion Word Benchmark。所以,数据是人工智能的基础。


第二,云计算并行能力提高。云计算降低了使用IT 资源的门槛,为数据集中化创造了基础,极大程度促进了大数据产业发展。与此同时,无论是GPU还是SPARK分布式计算的崛起使传统计算模式向并行计算模式转变,大幅度缩短了计算时间,为深度学习提供了较好的基础设施。所以,计算能力的指数级增长,是人工智能快速发展的关键。


第三,诸多底层算法开放,而算法始终都是人工智能的核心。只有在算法上取得进步才能更好地分析数据,进而充分挖掘数据价值。以前,很多人工智能的高精尖技术被大公司垄断,或者在大型实验室里以“专利”的形式被保护,如今底层算法在社区开源流动,这也就意味着作为数据大国的中国,完全有能力参与到AI产业化进程中。


 AI产业化之后,势必会面临高阶智慧工作者被取代的问题,但雷涛向记者坦言,知识本身在不断迭代,这对社会发展而言其实是必要的。他还强调,AI产业化进程中最大挑战还是专业人才的缺失,要把数据科学家、分布式计算人才等不同种类的人才和AI的行应用融合在一起,才能实现AI产业化。


金融业将是最先爆发的行业


人工智能产业化是要把不同因素耦合在一起,由数据科学(图像识别、语音识别、自然语言处理等)、计算资源(大规模并行集群)、数据资源,以及企业/政府/消费者应用组成,让更多人用更廉价的成本利用AI,像买书一样购买“Alpha Go”的预测能力。


雷涛称,AI产业化需要面向全行业。在谈及行业应用时,雷涛表示,随着越来越多数据驱动业务替代流程驱动业务,未来AI产业化需求最大的将是信息化最深入的领域,最典型的就是金融业。金融业是靠信息不对称实现盈利,而这需要掌握大量数据信息,AI产业化手段可以帮助金融业者利用数据重新定义金融产品与服务交付。


今年9月,毕马威中国首次举办中国金融科技50企业评选,以大数据科技为背景的天云大数据,与蚂蚁金服、京东金融、微众银行等新型金融公司被一同选入TOP50榜单,也正是因为天云通过MaximAI平台为银行业进行用户属性分析,提供定制化资金服务的模式是在改变金融产品设计以及其交互方式。


雷涛强调,就人工智能的发展程度而言,还处于弱人工智能时代,即窄领域或目标问题明确的业务问题解决;而普适性的强人工智能还期待认知科学等领域的进一步发展。


AI产业化时代的来临


得益于科技的变革,AI正式告别阳春白雪的年代,日益走向普及化、民主化,使得AI成为企业数字化转型的必备路径。在轻AI理念的普及之下,国内高科技企业正致力于对Alphago背后高深莫测的数据科学进行封装,增强其友好易用性,从而推动AI在企业的大规模应用。


据雷涛介绍,天云大数据的人工智能平台MaximAI,突破了Hadoop、Spark在部署使用上的瓶颈,在SPARK/ALLUXIO分布式内存计算框架下,使用scala语言彻底重构了深度强化学习等前沿数据科学算法,同时采用Free coding的免代码交互式调参优化,不再依赖于昂贵的GPU,在商业化X86集群上即可运行深度学习,实现了从并行化计算到分布式计算的转变。从而解决了分布式与机器学习算法难结合的问题,能够帮助企业快速实现AI产业化。


天云在面向大型企业用户时,还可以帮助他们基于自己的数据迅速实现自动化加工,做出风险模型、定价模型、评分模型、信用模型、运维优化模型,不再需要业务人员有很强的技术能力。


当问及天云是如何做到的时候,雷涛表示,他们的人工智能平台链接融合了数据和算法,让最前沿的深度学习算法利用分布式可以直接应用在全量在线的集群数据上,并依托Hadoop文件系统,能够应对海量,尤其是网络内容信息和社交网络交互信息等非结构化数据,能够对全量数据进行建模,避免因采样造成数据信息丢失。


同时,借助Spark计算架构,拥有分类、聚类、回归、降维等相关分布式算法, 通过分布式计算在多台计算机上平衡计算负载,节约了整体计算时间,大大提高了计算效率,同时提升算法性能;数据科学家通过对业务理解,利用天云大数据平台提供的图形用户界面,选择相应模型,参数,进行建模,实现业务目标,最后通过平台的生命周期的管理功能,来评估,发布,运行模型。


“天云提供的算法订阅服务将底层深度学习、梯度提升模型、随机森林等最前沿算法技术开放,使更多数据科学家、企业能够快速参与AI应用的研究开发,共同享受AI带来的无限商业价值。”


最后,雷涛提到,AI产业化处于早期市场阶段,人脸识别、趋势预测等场景的人工智能垂直应用层出不穷,未来,人工智能应用将朝着平台化方向发展,如IOS、Android所提供的支撑移动互联迅猛发展的AI应用平台化建设模式等, 这一切均预示着AI产业化的春天已然来临。



本文记者张叶(微信:1104644189)


来源:数据猿

活动预告

(点击图片,查看活动详情)


- 线上培训 -


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存